RSS : définitions et historique

Tags : Web 2.0, RSS
Fidèle aux objectifs de Defidoc, plutôt que de présenter rapidement le RSS pour sacrifier à une mode, nous avons fait le choix d'en faire une étude approfondie et de la débuter par un historique et une présentation des différentes normes existantes à ce jour. Un préalable important pour bien appréhender cette technologie qui peut s'avérer révolutionnaire pour nos habitudes d'utilisateur.
Un autre article présente le récent concurrent de RSS : Atom, et deux autres traitent de l'usage des fils RSS/Atom puis propose un panorama des lecteurs RSS/Atom

***

Dans le monde de l'Internet, l'année 2004 aura été incontestablement marquée par le développement fulgurant d'une nouvelle technologie connue sous le nom de « RSS ». Derrière ce terme quelque peu mystérieux voire magique, se profilent de nouvelles possibilités en matière de veille et de diffusion de l'information.
RSS est, en effet, capable d'indexer le contenu brut d'un site web sans s'occuper des données liées à sa forme. Ainsi, les documents publiés sur un site web peuvent être rapatriés et exploités de manière dynamique - sous forme de fil d'info - par d'autres sites. Par ailleurs, une grande majorité d'utilisateurs utilisent des logiciels spécialisés (lecteurs RSS) qui leur permettent de consulter les dernières informations publiées sur un site proposant un fil RSS et cela, sans se rendre directement sur le site web en question. Les usages sont très variés et les producteurs d'information également. En effet, si les grands sites d'actualité ainsi que certaines entreprises et administrations ont adopté le RSS, ce format de syndication de contenu a surtout explosé grâce au développement des blogs (journaux d'information personnels).
Mais avant de s'intéresser à toutes ces questions, il semble important de bien comprendre d'où vient le RSS pour mieux appréhender certaines zones d'ombre qui entourent aujourd'hui ce format.
En effet, RSS est traversé par une multiplicité de formats. Même le nom n'est pas standardisé. C'est ainsi que RSS peut signifier - selon les sites - Really Simple Syndication, Rich Site Summary ou encore RDF Site Summary. Précisons que RDF (Resource Description Framework) est un standard spécifié par le W3C en vue d'offrir un cadre formel de définition de métadonnées.

Un format non standardisé

La première version de RSS a vu le jour au cours de l'année 1999. Il s'agit de RSS 0.90 (RDF Site Summary), une norme développée par les équipes de Netscape. A l'époque, l'objectif de Netscape est de proposer un outil qui permette aux producteurs de contenu de diffuser facilement leurs informations sur l'Internet. Sur le portail MyNetscape.com, les utilisateurs peuvent aussi configurer leur page d'accueil personnalisée en choisissant les rubriques de leurs choix qui sont ensuite mises à jour de manière quotidienne. RSS 0.90 utilise les espaces de noms XML et RDF.
Peu après, apparaît RSS 0.91 créé par Dan Libby également auteur de la première version (0.90). Mais cette fois-ci, le principe évolue car ce format ne prend plus en compte le RDF et les espaces de noms XML. Cette version de RSS abandonne donc l'idée de proposer le résumé d'un site grâce aux métadonnées et se présente donc comme un simple format de syndication. RSS 0.91 n'utilise donc qu'une version allégée de XML. Dans le même temps, le terme RSS est rebaptisé Rich Site Summary.

L'intérêt de Netscape pour RSS va commencer à s'effriter. C'est alors le début d'un conflit ouvert entre différentes approches du format RSS. D'un côté, apparaît RSS 1,0 qui s'appuie sur la version d'origine (0.90) et donc revient au standard RDF. De l'autre côté, une autre vision du format s'épanouit à travers RSS 0.91 (sans RDF) qui va donner naissance à des versions ultérieures : RSS 0.92 ; RSS 0.93 ; RSS 0.94 puis RSS 2.0. Cette dernière mouture, réalisée par Dave Winer, prend en compte les espaces de noms pour permettre l'ajout de modules. Enfin, dernière en date, RSS 2.01 remplace RSS 2.0 en novembre 2002.
La guerre fait rage et Aaron Swartz, l'un des co-auteurs de la version 1.0 lance alors RSS 3.0 non sans avoir auparavant parodié Dave Winer en écrivant sur son weblog « The Road to RSS 3.0 » (Dave Winer avait annoncé RSS 2.0 avec un article intitulé « The Road to RSS 2.0 »). Cette version 3.0 ne prend pas en comptes les espaces de noms et la syntaxe XML.
C'est dans ce contexte très mouvementé et peu ouvert au dialogue et à la coordination qu'un nouveau groupe de travail s'est mis en place pour lancer, au cours de l'année 2003, un nouveau format de syndication baptisé Atom. Devant le succès de ce dernier (soutenu notamment par Google), une solution semble envisageable, Dave Winer ayant proposé finalement de fusionner Atom et RSS 2.0. Affaire à suivre...

Pour conclure, RSS apparaît comme une famille de protocoles de syndication de contenu qui utilise la norme XML. Ce sont les approches différentes et concurrentes de ce format qui sont, en partie, à l'origine des trois significations connues du terme RSS : Really Simple Syndication, Rich Site Summary ou encore RDF Site Summary.

Actuellement, RSS regroupe plusieurs formats qui ne sont pas compatibles entre eux. Ceux qui sont les plus utilisés aujourd'hui peuvent être regroupées en deux familles :
** RSS 0.91 ; RSS 0.92 ; RSS 2.0. Le Rich Site Summary également appelé RSS 0.9x et RSS 2.x
** RSS 1.0. Le RDF Site Summary, également appelé RSS 1.x.

|cc| Fabrice Molinaro - février 2005 - mai 2006

voir aussi :

Atom, présentation - Quels usages pour les flux RSS/Atom ? - Comment lire les flux RSS ? Panorama des lecteurs/agrégateurs RSS - Les fils RSS/Atom et la veille

Fabrice MOLINARO